寻找最新最佳的3D 动画人工智能。浏览最全面的AI数据库,每日持续更新。
最新
VoxDeck 是一款人工智能演示文稿创作工具,它彻底改变了演示文稿的制作流程,将简单的文本提示或上传的材料转化为视觉效果惊艳的专业幻灯片。它擅长打造沉浸式、影院级的幻灯片体验,并运用 3D 图表、交互式视觉效果和逼真的头像等元素,动态地讲述和呈现内容。该工具旨在通过自动化大部分设计和创作流程,节省专业人士、教育工作者和商业用户的时间和精力,同时确保演
OmniPart 是一个用于生成零件感知型 3D 对象的新型框架,它在保持稳健结构内聚力的同时,实现了组件之间的高度语义解耦。该框架旨在克服传统生成方法仅能生成单一形状的局限性,从而限制了它们在交互式应用中的实用性。OmniPart 以独特的方式将复杂的 3D 对象生成任务解耦为两个协同阶段,从而能够创建具有明确、可编辑零件结构的 3D 资源。
3DV-TON 是一款先进的视频试穿框架,旨在无缝替换视频序列中的服装,并提供高保真、时间一致的效果。传统的视频试穿方法往往难以应对复杂的服装图案和多样的体态,而 3DV-TON 则引入了一种基于漫射的、由纹理 3D 网格引导的方法。这种明确的 3D 引导机制使系统能够直接参考服装纹理运动,确保服装的过渡在整个视频中保持逼真和连贯。通过利用这些可动画化
DreamActor-M1 是一款基于扩散变换技术的先进人体图像动画框架,能够通过单张静态图像创建高度逼真且富有表现力的动画。它能够对面部表情和全身动作进行精细的整体控制,使用户能够为肖像和全身镜头制作动画,且不会损失细节或画质。该模型采用混合运动引导系统,整合了隐式面部表征、3D 头部球体和 3D 身体骨骼,从而生成自然且能够保留身份的动画,捕捉细微
VACE 是一个一体化的视频创作和编辑框架,旨在将多种视频合成和编辑任务统一到一个多功能模型中。它支持多种功能,包括文本转视频生成、引用转视频生成、视频转视频编辑以及带蒙版的视频转视频编辑。通过将文本、图像、视频和蒙版等多种输入模式集成到一个统一的视频条件单元 (VCU) 中,VACE 能够无缝处理传统上需要多种专用工具才能完成的复杂视频任务。该模型利
LHM 是一个突破性的模型,旨在通过单张图像快速、高保真地重建可动画的 3D 人体。它利用多模态 Transformer 架构,通过注意力机制有效地编码人体位置特征和图像特征,解决了分离几何形状、外观和变形的复杂挑战。这能够保留服装的几何形状和纹理细节,并通过 3D 高斯分布生成逼真的 3D 虚拟形象。该模型引入了一种头部特征金字塔编码方案,用于聚合头
VideoDiT 是一个先进的视频生成框架,它弥合了图像扩散变换器和视频合成之间的差距。通过将分布保持变分自编码器 (DP-VAE) 和 3D 扩散变换器集成到预训练的文本转图像 (T2I) 模型中,VideoDiT 能够以最少的附加参数实现高效的联合训练和高质量的视频合成。该架构旨在充分利用强大的图像扩散模型的优势,同时扩展其处理视频数据时空复杂性的
Uni3C 是一个统一的 3D 增强框架,旨在在视频生成过程中精确且同时控制摄像机和人体运动。传统方法通常将摄像机运动和人体动画视为独立的任务,这导致灵活性有限,并且需要大量带注释的数据集。Uni3C 通过引入即插即用的控制模块 PCDController 来应对这些挑战。该模块利用单目深度估计得到的未投影 3D 点云来实现细粒度的摄像机控制。该模块可
Seaweed 是由字节跳动开发的先进的视频生成基础模型,旨在通过文本提示、上传的图片或音频提示,生成高质量、逼真的视频。Seaweed 构建于高效的 70 亿参数架构之上,凭借卓越的语义理解和视觉保真度,能够生成连贯一致的多镜头长篇故事。该模型支持 1280x720 分辨率和 24 帧/秒的实时视频生成,非常适合寻求快速内容创作的创意专业人士和日常用
HoloPart 是一个用于生成式 3D 部件非模态分割的尖端开源框架,旨在彻底改变 3D 模型的分解和编辑方式。传统的 3D 模型,无论是手工制作、扫描还是生成的,通常都以单一、未分割的网格形式存在,这使得分离、编辑或为各个组件制作动画变得非常困难。HoloPart 通过引入 3D 部件非模态分割的概念来解决这一挑战,该概念超越了可见表面分割,即使部
UniAnimate-DiT 是一个先进的人体图像动画开源框架,利用大规模视频扩散变换器生成视觉冲击力强且时间一致性高的动画。UniAnimate-DiT 基于强大的 Wan2.1 视频扩散模型,引入了一种精简的方法,利用低秩自适应 (LoRA) 进行高效微调,显著降低了内存开销,同时保持了较高的生成性能。该系统旨在根据一系列目标姿势为单个参考图像制作
Redraw 借助先进的自动化技术,帮助建筑师、设计师和工程师在 30 秒内创建逼真的渲染图。该云平台简化了室内/室外环境的工作流程,使用户能够增强现有渲染图,将草图转化为精美的视觉效果,并为各种建筑风格激发灵感。其直观的界面支持文本转图像功能,使专业人士能够用自然语言描述概念并获得即时可视化效果。学生、自由职业者和企业受益于可扩展的工具,这些工具可与
浑元 3D 2.0 是腾讯开发的一款突破性的开源 AI 系统,用于生成高质量的 3D 模型和资产。这一创新平台代表了 AI 驱动的 3D 内容创作领域的重大飞跃,为专业人士和业余爱好者提供了全面的解决方案。
浑元 3D 2.0 的核心采用了复杂的两阶段生成流程。第一阶段涉及创建高质量的裸网格,这由名为 Hunyuan3
LatentSync 是字节跳动开发的创新型口型同步框架,利用音频调节潜在扩散模型在视频中生成高质量、同步的口型动作。这种端到端解决方案的突出之处在于,它无需中间运动表示,而这在传统的口型同步方法中通常是必需的。通过利用稳定扩散的功能,LatentSync 可以有效捕捉复杂的视听相关性,从而创建动态且逼真的说话视频。
TRELLIS 3D 是一个先进的框架,旨在从文本和图像输入中生成高质量的 3D 资源。这个创新平台利用尖端的人工智能技术,特别是其结构化 LATent (SLAT) 表示,来创建多功能和复杂的 3D 模型。该框架旨在满足各种应用的需求,包括游戏开发、动画、建筑可视化和数字艺术,使其成为专业人士和爱好者的宝贵工具。
T
Clip Studio Paint 是一款多功能数字艺术软件,适用于各种艺术创作,包括插画、漫画创作和动画。它尤其受到艺术家的青睐,因为它能够复制传统艺术技巧,同时提供先进的数字功能。该平台旨在满足初学者和专业艺术家的需求,使其成为创意社区的热门选择。
Clip Studio Paint 的突出功能之一是其广泛的画笔和工具自定义
CogVideo 和 CogVideoX 是清华大学研究人员开发的先进文本转视频生成模型。这些模型代表了人工智能视频创作领域的重大进步,使用户能够根据文本提示生成高质量的视频内容。
原始模型 CogVideo 是一个具有 94 亿个参数的大规模预训练转换器。它基于 540 万个文本-视频对进行训练,继承了 CogVie
LivePortrait:带拼接和重定向控制的高效人像动画。该框架由快手科技团队开发,旨在从单一源图像合成逼真的视频。LivePortrait 使用外观参考和来自各种输入(例如驾驶视频、音频、文本或生成)的运动数据,在计算效率和可控性之间取得平衡。
关键创新在于其基于隐式关键点的框架,它有别于主流的基于扩散的方法,可增
CartoonGen 是一个人工智能平台,允许用户将照片和文字描述转换成引人入胜的卡通图像。CartoonGen 专为艺术家、营销人员以及任何对创造有趣且富有表现力的视觉效果感兴趣的人而设计,通过其用户友好的界面和先进的算法简化了卡通创作过程。该平台可满足从个人项目到专业营销材料的各种需求,使其成为数字艺术和设计领域的多功能工具。
Avatar One 是一个先进的 AI 平台,旨在创建完全可定制的数字化身并与之互动,专为寻求虚拟伴侣体验的用户量身定制。该平台允许个人在 3D 环境中与自己的数字化身互动,与传统的静态数字化身相比,可提供更具沉浸感和互动性的体验。用户可以创建自己的 AI 伴侣,这些伴侣不仅与他们相似,而且还会表现出与他们的偏好相符的个性特征和行为。